Vers l'intégration multidimensionnelle d'Open Data dans les entrepôts de données
نویسندگان
چکیده
Résumé. L’émergence de nombreuses sources d’Open Data poussent plusieurs communautés de recherche ainsi que des entreprises à développer des outils permettant leur exploitation. En particulier, les données statistiques présentes dans les Open Data peuvent constituer des informations utiles aux analyses décisionnelles. Toutefois les Open Data très hétérogènes et disséminés en plusieurs morceaux de données sur le web, rendent difficile leur intégration au sein d’un entrepôt de données. Les travaux actuels sur l’intégration des Open Data proposent des processus d’intégration basés sur des Linked Open Data, dont la mise en place n’est pas automatisée. Dans cet article, nous proposons un processus visant à automatiser l’entreposage multidimensionnel des Open Data. Notre démarche repose sur la transformation des Open Data en un graphe générique et enrichi favorisant leur intégration. Ce graphe sert de support pour la définition semi-automatique et incrémentale du schéma multidimensionnel d’entreposage.
منابع مشابه
Panorama de travaux autour de l'intégration de données spatio-temporelles dans les hypercubes
Résumé : Cet article présente un panorama des différents travaux qui sont effectués dans notre équipe autour de l’intégration des données spatiotemporelles dans les entrepôts de données et les hypercubes. Nous nous sommes plus particulièrement intéressés à la prise en compte des évolutions dans les dimensions spatiales, à la modélisation multidimensionnelle de données continues et à la concepti...
متن کاملApproche de modélisation multidimensionnelle des données complexes : application aux données médicales,
Résumé. La vocation d’un entrepôt de données est l’analyse de données pour l’aide à la décision dans les entreprises. La modélisation multidimensionnelle est la base des entrepôts de données et de l’analyse en ligne (OLAP). Ces techniques sont efficaces pour traiter les données simples numériques, mais elles ne sont pas adaptées aux données variées et hétérogènes provenant de différentes source...
متن کاملUn index de jointure pour les entrepôts des données XML
Résumé. Les entrepôts de données XML proposent une base intéressante pour les applications décisionnelles qui exploitent des données hétérogènes et provenant de sources multiples. Cependant, les performances des SGBD natifs XML étant actuellement limitées, il est nécessaire de trouver des moyens de les optimiser. Dans cet article, nous proposons un nouvel index spécifiquement adapté à l’archite...
متن کاملVers l'intégration de la prédiction dans les cubes OLAP
L’analyse en ligne OLAP (On Line Analytical Processing) soutient les entrepôts de données dans le processus d’aide à la décision. Cependant, il n’existe pas d’outils pour guider l’utilisateur dans l’exploration, ni pour approfondir l’analyse vers l’explication et la prédiction. Dans un processus décisionnel, un utilisateur peut vouloir anticiper la réalisation d’évènements futurs. Le couplage d...
متن کاملUn index de jointure pour les entrep\^ots de donn\'ees XML
Résumé. Les entrepôts de données XML proposent une base intéressante pour les applications décisionnelles qui exploitent des données hétérogènes et provenant de sources multiples. Cependant, les performances des SGBD natifs XML étant actuellement limitées, il est nécessaire de trouver des moyens de les optimiser. Dans cet article, nous proposons un nouvel index spécifiquement adapté à l’archite...
متن کامل